(電子商務(wù)研究中心訊) AlphaGO還能做什么?本次人機大賽的結(jié)果基本沒有懸念,所以這次AlphaGo與柯潔的對戰(zhàn),看點已經(jīng)不是棋局的輸贏,而是AlphaGo是否能進入更加實用的領(lǐng)域,實現(xiàn)產(chǎn)品化。AlphaGo是一個標(biāo)志,意味著人們對人工智能的探索已經(jīng)達到一個新的階段,人工智能將逐漸滲透到各個行業(yè),提高各行業(yè)的效率。目前AlphaGo的創(chuàng)始團隊DeepMind利用AI系統(tǒng),優(yōu)化整個機房的冷卻系統(tǒng)的用電效率,幫助谷歌減少40%在機房冷卻系統(tǒng)上的花費,節(jié)省上億美金。同時也正在將AlphaGo的變體應(yīng)用于醫(yī)療行業(yè),用AlphaGo的算法來模擬蛋白質(zhì)的3D折疊,可以使藥物研發(fā)加速5到10年。還希望能夠與英國國家電網(wǎng)合作,利用人工智能將英國的能耗減少10%。
強大的分布式計算群在底層支撐AlphaGo。AlphaGo強大的計算能力是通過通用硬件搭建的分布式計算群來支撐的,根據(jù)Deepmind員工發(fā)表在2016年1月Nature期刊的論文,分布式版本使用了1202個CPU和176個GPU,同時可以有40個搜索線程。AlphaGo的計算能力達到3.38PFLOPS,是當(dāng)年IBM深藍的3萬倍,而我國天河二號超級計算機,運算能力達到33.86PFLOPS,是深藍的30萬倍。
深度學(xué)習(xí)算法是AlphaGo打敗人類選手的秘訣。AlphaGo的算法結(jié)構(gòu)是:深度神經(jīng)網(wǎng)絡(luò)+監(jiān)督/強化學(xué)習(xí)+蒙特卡洛樹搜索。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)訓(xùn)練出三個網(wǎng)絡(luò):兩個落子策略+一個局面評估模型,這三個策略的神經(jīng)網(wǎng)絡(luò)架構(gòu)基本相同,參數(shù)不同。AlphaG0 1.0版本通過輸入幾千萬個人類棋譜,訓(xùn)練神經(jīng)網(wǎng)絡(luò),給出圍棋手?jǐn)?shù)的估值,而增強學(xué)習(xí)類似一個“自學(xué)成長腦”,給神經(jīng)網(wǎng)絡(luò)提供不限量的計算樣本通過反復(fù)和過去的“自己”下棋來獲得數(shù)據(jù),通過輸贏來判喜斷好壞,根據(jù)好壞結(jié)果來計算策略梯度,從而更新參數(shù)。通過反復(fù)的自學(xué),自己產(chǎn)生了新的下棋方法,形成自己的一套更強的下棋風(fēng)格。
我們認(rèn)為在現(xiàn)有計算能力的支撐下,數(shù)據(jù)是AI重要的資產(chǎn),通過海量的數(shù)據(jù)才可以更好的培訓(xùn)算法。目前AI正在數(shù)據(jù)化程度高的行業(yè)逐漸落地,安防、醫(yī)療、金融、零售等行業(yè)數(shù)據(jù)電子化程度高且比較集中,將率先涌現(xiàn)大量的人工智能場景應(yīng)用。建議關(guān)注海康威視、萬東醫(yī)療。(來源:浙商證券 文/楊云 編選:中國電子商務(wù)研究中心)